Company LOGO คล งข อม ล (Data Warehouse) อาจารย ดร.ศ ร ล กษณ อาร ร ชชก ล Email: sirilak.ar@ssru.ac.th 1 AGENDA Introduction to Data Warehouse Differences between Operational Database and Data Warehouse Data Warehouse Architecture Multidimensional Data Model OLAP 2 1
ว ตถ ประสงค บทนำ (Introduction) อธ บายความหมาย ความส มพ นธ ระหว างฐานข อม ล คล งข อม ล แนวค ด ท มาของคล งข อม ล อธ บายความส าค ญและประโยชน ของคล งข อม ล 3 บทนำ (Introduction) ข อม ลและสารสนเทศ (Data Versus Information) ข อม ล (Data) ข อม ลแบบม โครงสร าง (Structured Data) ข อม ลแบบไม ม โครงสร าง (Unstructured Data) ต วอย างเช น อ ซ อมรถสามารถนาข อม ลท งแบบม โครงสร าง (ข อม ลล กค า, ข อม ล รถ) นามาใช ร วมก บข อม ลไม ม โครงสร างเช นข อม ลภาพถ ายด จ ตอล ภาพสแกน ของรถท เก ดอ บ ต เหต นาส งพร อมแบบฟอร มข อม ลเพ อส งเคลมก บบร ษ ท ประก นภ ย 4 2
บทนำ (Introduction) ข อม ล (Data) - ข อเท จจร ง ว ตถ หร อเหต การณ ท เก ดข น ค อเป นข อม ลท ไม ได ผ านการ ประมวลผล สารสนเทศ (Information) - ข อม ลท ผ านการประมวลผลและสามารถน าไปใช ให เก ดประโยชน ตาม ว ตถ ประสงค ได 5 บทนำ (Introduction) ระบบการจ ดการข อม ล (Data Management System) บ นท กข อม ลลงในสม ด ไม ม ร ปแบบการจดบ นท กท แน นอน บ นท กในเอกสารจ ดเก บในแฟ มเอกสารอย างเป นหมวดหม ม การท าสารบ ญ การทาด ชน บ นท กลงคอมพ วเตอร จ กเก บลงในฮาร ดด สก 6 3
ร ปแบบกำรจ ดกำรข อม ลในองค กร แฟ มข อม ล files กระดาษ paper ฐานข อม ล database การจ ดการข อม ล Data Management คล งข อม ล Data Warehouse 7 มาร ทข อม ล Data mart บทนำ (Introduction) กระดาษ (Paper) ข อม ลท อย ในร ปกระดำษ ทำให ไม สำมำรถประมวลผลด วยโปรแกรม คอมพ วเตอร ได อ กท งย งย งยำกและเส ยเน อท มำกในกำรจ ดเก บ แฟ มข อม ล (Files) ข อม ลท เก บในร ปแบบน เรำสำมำรถประมวลผลข อม ลด วยโปรแกรมคอมพ วเตอร ได กำรจ ดเก บข อม ลทำได ง ำยข นและช วยประหย ดพ นท ในกำรจ ดเก บแต ย งม ป ญหำถ ำม ข อม ลจำนวนมำกไม ม กำรจ ดเก บข อม ลอย ำงเป นระบบ ฐานข อม ล(Database) ม กำรจ ดเก บข อม ลอย ำงเป นระบบไว ในฐำนข อม ลเด ยวก นม กำรจ ดกำร พจนำน กรมข อม ล(Data Dictionary หร อ Metadata)ทำให ง ำยต อกำรปร บปร ง ข อม ล กำรประมวลผล กำรเร ยกใช ข อม ล รวมท งย งม กำรร กษำควำมปลอดภ ยของ ข อม ล แต ฐำนข อม ลย งไม เหมำะสำหร บผ บร หำรในกำรเร ยกใช (Retrieve)และ กำรว เครำะห ข อม ล (Analyze) 8 4
ควำมเป นมำเก ยวก บคล งข อม ล สารสนเทศ (information) ถ อว ำป จจ ยสำค ญท เป นต วช ว ดควำมสำเร จของ องค กรต ำงๆเด มท ผ บร หำรก อำศ ยระบบฐำนข อม ลเช งปฏ บ ต กำร (operational database) ระบบฐานข อม ลเช งปฏ บ ต การ (operational database) ม ว ตถ ประสงค หล กในการ เก บข อม ลด งน กำรลดควำมซ ำซ อน (redundancy) กำรร กษำควำมถ กต อง (integrity) กำรลดกำรส ญหำยของข อม ล (information lost) กำรลดควำมผ ดพลำดท เก ดจำกกำรแก ไขข อม ล (update anomalies) 9 ควำมเป นมำเก ยวก บคล งข อม ล ข อจาก ดของ operational database ค อไม ตอบสนองต อผ บร หำรท จะนำมำเป น เคร องม อหร อระบบท ช วยสน บสน นกำรต ดส นใจ(decision support system) ในกำรดำเน นกำรแต ละคร งน นต องม กำรเร ยกใช ข อม ลจำนวนมำกจำกฐำนข อม ล ขนำดใหญ ท งท เป นข อม ลในอด ตและป จจ บ น ซ ง operational database ไม ตอบสนองควำมต องกำรในล กษณะน เพรำะต องเส ยเวลำในกำรรวมข อม ลอ กอำจ ก อให เก ดป ญหำในกำรดำเน นกำรประจำว นต ำงๆ 10 5
ควำมเป นมำเก ยวก บคล งข อม ล แนวโน มในการพ ฒนาเทคโนโลย เป นไปอย างต อเน อง องค กรต างๆม การจ ดเก บ ฐานข อม ลไว เพ อใช งาน ซ งการนาเสนอข อม ลต างๆจากฐานข อม ลไม ได ม เพ ยง แค รายงานประจาว น รายงานสร ปผล แต ย งรวมถ งการพ ฒนาระบบฐานข อม ลท ม การรวบรวมข อม ลขนาดใหญ มาก ท งข อม ลภายในและข อม ลภายนอกองค กร เพ อนามาใช ในการประกอบการต ดส นใจ ด งน นจ งเก ดแนวค ดท จะพ ฒนาระบบฐานข อม ลท จ ดเก บข อม ลในร ปแบบของ คล งท สามารถรองร บข อม ลท เพ มข นเร อยๆ และท ส าค ญค อสามารถนาข อม ลมา ใช เพ อประกอบการต ดส นใจของผ บร หาร 11 ควำมเป นมำเก ยวก บคล งข อม ล ต วอย างเช น บร ษ ทแห งหน งซ งม ใบกำก บส นค ำหร อ อ นวอยส ท จ ดเก บรำยละเอ ยด สำค ญเช น ข อม ลล กค ำ รำยกำรส นค ำ ว นท ซ อ และจำนวนเง น แต เม อม กำรรวบรวม ข อม ลเหล ำน เพ อใช ในกำรว เครำะห ผล ตภ ณฑ เพ อเพ มยอดขำย และพ ฒนำผล ตภ ณฑ ใหม กล บพบว ำข อม ลม ปร มำณขนำดใหญ มำก ด งน นจ งจำเป นต องม เคร องม อหร อ ซอฟต แวร เพ อใช ในกำรจ ดเก บข อม ลขำนดใหญ ด งน น data warehouse จ งจำเป นและม ควำมสำค ญสำมำรถ จ ดเก บข อม ลจำกหลำย แหล งให ม ประส ทธ ภำพส ง และจ ดเก บข อม ลแยกออกจำก operational database สำมำรถส บค นข อม ล (query) เพ อใช ในกำรว เครำะห ทำงธ รก จได อย ำงท น ต อสถำณกำรณ สำมำรถสน บสน นในกำรต ดส นใจของผ บร หำร ในกำรนำ องค กรม งส เป ำหมำยท ต งไว 12 6
1/17/2014 ควำมสำค ญและประโยชน ของ Data Warehouse ลดความซ าซ อนก นของข อม ล ในกระบวนกำรพ ฒนำ data warehouse จะต องม กำร กรองข อม ล กำร clean ข อม ล กำรแปลงข อม ล ท งข อม ลภำยในและภำยนอก องค กร ให อย ในร ปแบบมำตรฐำนเด ยวก นก อนท ข อม ลจะถ กเก บใน data warehouse database ทำให ลดกำรซ ำซ อนก นของข อม ล ช วยให กำร query ข อม ล รวดเร วและม ควำมถ กต องส ง เป นเคร องม อช วยในการต ดส นใจของผ บร หาร เน องจำก data warehouse จ ดเก บ ข อม ลท แตกต ำงก นเป นจำนวนมำกต งแต อด ตจนถ งป จจ บ น ซ งข อม ลท งหมดน น จะถ กจ ดกำรให ม ควำมสอดคล องก น ด งน นจ งเป นต วช วยให ผ บร หำรสำมำรถ ว เครำะห ถ งป ญหำและแนวทำงกำรแก ไข ช วยเพ มประส ทธ ภำพในกำร ดำเน นกำร เช นแนวโน มของตลำด ควำมต องกำรของผ บร โภค เป นต น 13 ควำมสำค ญและประโยชน ของ Data Warehouse เร ยกใช ข อม ลได อย างรวดเร วและม ประส ทธ ภาพมากข น เน องจำกคล งข อม ลช วย ลดปร มำณในกำรจ ดเก บข อม ล จ งประโยชน ในกำรช วยลดป ญหำควำมล ำช ำน ทำให ระบบกำรประมวลผลม ประส ทธ มำกข น ช วยทำให สำมำรถเข ำถ งข อม ลได ง ำยและรวดเร วข น นอกจำกน นย ง สำมำรถในกำรประมวลผลสร ปข อม ลข นส ง ช วยให ผ บร หำรสำมำรถค นหำข อม ลได ง ำย รวดเร วและน ำมำใช อย ำงม ประส ทธ ภำพมำกข น การน าเสนอข อม ลม ความหลากหลาย จำกเด มข อม ลจำก operational database สำมำรถนำเสนอข อม ลในร ปแบบตำรำง ถ ำต องกำรนำเสนอข อม ลในร ปแบบ กรำฟ จะต องค ดลอกข อม ลจำกฐำนข อม ลไปลงในโปรแกรมอ นๆ เช น เอ กเซลล เป นต น เพ อสร ำงกรำฟ ซ งถ อเป นเร องท ย งยำก ด งน น data warehouse จ งม ประโยชน ในกำรช วยตอบสนองตำมควำมต องกำรของผ บร หำรเพรำะสำมำรถ กำรนำเสนอข อม ลในร ปแบบกรำฟแท ง วงกลม ตำรำง ได ท นท 14 7
ข อจำก ดของ Data Warehouse ข นตอนในการเตร ยมและรวบรวมข อม ลใช เวลานาน เน องจำกข อม ลท จะนำเข ำเก บ DW ต องผ ำนกระบวนกำรต ำงๆ ต งแต กำรกรอง (extract) แปลงข อม ล (transform) และกำรนำเข ำข อม ล (load) รวมเร ยกว ำ กระบวนกำร ETL ซ ง กระบวนกำรน ต องอำศ ยผ ท ม ควำมชำ นำญในกำรกรองข อม ล แปลงข อม ล ทำ ให เส ยเวลำนำนมำก ความต องการข อม ลของผ ใช เพ มข นเร อยๆ เน องจำกควำมต องกำรของผ ใช ท ม กำรเปล ยนแปลงตลอดเวลำ โดยเฉพำะอย ำงย งควำมต องกำรข อม ลย งเพ มมำก เท ำไหร ควำมซ บซ อนในกำรทำงำนก มำกข นเท ำน น 15 ข อจำก ดของ Data Warehouse การพ ฒนา Data Warehouse ใช เวลานานและลงท นส ง Data Warehouse System ม ความซ บซ อน DW เก บรวบรวมข อม ลของท ง องค กรจำกหลำยๆระบบต งแต อด ตจนถ งป จจ บ น ซ งทำให ระบบคล งข อม ลม ควำมซ บซ อนส ง ต องอำศ ยผ ท ม ควำมช ำนำญโดยเฉพำะมำบร หำรจ ดกำร คล งข อม ล 16 8
ความแตกต างระหว าง Data Warehouse ก บ Operational database Data Warehouse (DW) ค อ ฐำนข อม ลขนำดใหญ สำหร บท งองค กรซ รวบรวม ข อม ลจำกฐำนข อม ลหลำยแหล งหลำยช วงเวลำมำรวมท เด ยวก น โดยข อม ลท รวบรวมมำน นอำจจะเป นข อม ลท ใช อย ในป จจ บ นก บข อม ลในอด ตแลฐำนข อม ล อ นภำยนอกองค กร หร อเร ยกว ำ external database ข อม ลท จ ดเก บใน DW น นจะต องผ ำนกระบวนกำร ETL เพ อทำให เป นมำตรฐำน เด ยวก นก อน ทำให สำมำรถใช งำนข อม ลร วมก นได ท งองค กรไม ว ำจะเป นกำร ส บค นข อม ลในร ปแบบต ำงๆ ช น ตำรำง กรำฟ รำยงำน เป นต น เพ อว เครำะห ข อม ลสำหร บใช ประโยชน ต อไป กำรดำเน นกำรก บข อม ลใน DW จะม เพ ยงกำร load และ เร ยกด ข อม ล query เท ำน น 17 Differences between Operational Database and Data Warehouse Differences between Operational Database and Data Warehouse ว ตถ ประสงค อธ บายความแตกต างระหว าง Operational Database และ Data Wharehouse อธ บายค ณล กษณะส าค ญของ Data Warehouse 18 9
ความแตกต างระหว าง Data Warehouse ก บ Operational database นอกจำกน ข อม ลใน data warehouse ย งเป นข อม ลพ นฐำนสำหร บสำรสนเทศอ นๆ ต อไป เช นระบบสน บสน นกำรต ดส นใจ ( Decision Support System, DSS ) หร อ ระบบบร หำรควำมส มพ นธ ก บล กค ำ (Customer Relationship Management, CRM) รวมไปถ งเป นข อม ลท สน บสน นระบบธ รก จอ ฉร ยะ ( Business Intelligence System, BIS) Operational Database ค อ กำรรวบรวมข อม ลท ม ควำมส มพ นธ ก น โดยจ ดเก บข อม ล เช งปฏ บ ต กำรสำหร บกำรดำเน นกำรรำยว นม ข อม ลม กำรเปล ยนแปลงตลอดเวลำ กล ำวค อ ม กำรเพ มข อม ล Insert กำรลบข อม ล Delete กำรปร บเปล ยนข อม ล Update ให เป นป จจ บ นอย เสมอ 19 ความแตกต างระหว าง Data Warehouse ก บ Operational database Delete Insert Update Insert Operational Database Update Delete Load Data Warehouse Access 20 10
1/17/2014 ความแตกต างระหว าง Data Warehouse ก บ Operational database ค ณล กษณะเฉพาะของข อม ลใน DW ข อม ลตามห วข อ (Subject-Oriented Data) ในองค กรแต ละแห งม กพ ฒนำระบบข อม ลเพ อให สอดคล องต อกำรทำงำน ขององค กรท แตกต ำงก นเช น พ ฒนำระบบข อม ลสำหร บกำรขำยส นค ำ สำหร บ ว เครำะห ข อม ลกำรขำยส นค ำ พ ฒนำระบบข อม ลส นค ำคงคล ง สำหร บว เครำะห ข อม ลในกำรส งส นค ำเข ำ หร อกำรจ ำยส นค ำออก ซ งกำรจ ดระบบข อม ลแบบน เป นกำรจ ดตำมก จกรรมขององค กร คล งข อม ลจะต องถ กสร ำงจำกห วข อหล กทำงธ รก จท เน นเน อหำท สนใจ เช น ล กค ำ (Customer) ผล ตภ ณฑ (product) ยอดขำย (sales) ใบกำก บภำษ ล กค ำ (customer invoicing) กำรควบค มสต อก (stock control) และ กำรขำยผล ตภ ณฑ (product sales) ส งเหล ำน แสดงให เห นถ งควำมต องกำรกำรจ ดเก บเพ อใช ในกำร สน บสน นองค กร 21 ความแตกต างระหว าง Data Warehouse ก บ Operational database Example Operational Database (Application- Oriented) Loans Savings Bank Card Data Warehouse (Subject-Oriented) Customer Vendor Product 22 11
ความแตกต างระหว าง Data Warehouse ก บ Operational database ค ณล กษณะของข อม ลในคล งข อม ล ข อม ลม ล กษณะสอดคล องก น Integrated Data ข อม ลท เข ำมำส คล งข อม ลน นม ท มำจำกหลำยๆ แหล ง เช น จำกระบบ สำรสนเทศต ำงๆในองค กร หร อจำกแหล งข อม ลภำยนอก หร อกำรจ ดเก บข อม ล อย ในร ปแบบแตกต ำงก น ด งน นจ งเป นไปได ท จะเก ดข อม ลซ ำก น กล ำวค อข อม ล ต วเด ยวก น แต ม ท มำต ำงก นหร อมำตรฐำนข อม ลแตกต ำงก น หน ำท ของคล งข อม ลค อ กำรกำจ ดกำรซ ำซ อนของข อม ลค อกำรทำให ข อม ลม สมบ ต เป น Integrated Data เพ อไม ให เก ดควำมส บสนในกำรว เครำะห ข อม ล 23 ความแตกต างระหว าง Data Warehouse ก บ Operational database ฐานข อม ลระด บปฏ บ ต การ ม การออกแบบฐานข อม ลท แตกต างก น เช น การอ างอ งร ปแบบว นท ท แตกต างก นอาจจ ดในร ปแบบของ yymmdd, mmddyy หร อ mmddyyyy ด งน นระบบ integrated ต องม การจ ดเก บให ม ร ปแบบเด ยวก น 24 12
ความแตกต างระหว าง Data Warehouse ก บ Operational database Integrated Data Savings Account Checking Account Loans Account Data From Applications 25 Subject = Account Data Warehouse Subjects ความแตกต างระหว าง Data Warehouse ก บ Operational database ค ณล กษณะของข อม ลในคล งข อม ล ข อม ลส มพ นธ ก บเวลา (Time-Variant Data) ข อม ลในฐำนข อม ลปฏ บ ต กำร (Operational Database) ม งเน นควำมเป น ป จจ บ น และต องปร บปร งให ท นสม ยอย ตลอดเวลำอำจเก บในช วง 1 ป แต ข อม ล ในคล งข อม ลจะเป นข อม ลท ม อด ตช วงอำย ในระยะเวลำหน ง (Historical Data) อำจม ระยะเวลำต งแต 5-10 ป ท งน ข นก บควำมเหมำะสมเป นหล ก กำรนำข อม ล ย อนหล งท เก บรวบรวมไว ก เพ อนำมำทำกำรว เครำะห เปร ยบเท ยบหำแนวโน ม และใช พยำกรณ ทำงธ รก จ 26 13
ความแตกต างระหว าง Data Warehouse ก บ Operational database ค ณล กษณะของข อม ลในคล งข อม ล ข อม ลส มพ นธ ก บเวลา (Time-Variant Data) ต วอย ำงเช น ข อม ลผ ป วย ต องเก บประว ต กำรร กษำพยำบำลอย ำงน อย 10 ป เพ อใช เปร ยบเท ยบ หำแนวโน มและทำนำยส ขภำพอนำม ยในอนำคตได โดยจะ ส มพ นธ ก บกำรดำเน นกำรของธ รก จน น เช นโรงพยำบำลอำจจะพ ฒนำระบบกำร เต อนผ ป วยในแต ละช วงเวลำท อำจเก ดโรคต ำงๆ เป นต น ด งน นกำรต ดส นด ำน กำรบร หำรต ำงๆ เช น กำรจ ดเตร ยมยำร กษำโรคท จำเป นให เพ ยงพอก บท ก สถำนกำรณ ซ งจำเป นต องอำศ ยข อม ลเปร ยบเท ยบในแต ละช วงเวลำ เพ อกำร วำงแผนและต ดส นใจอย ำงถ กต อง 27 ความแตกต างระหว าง Data Warehouse ก บ Operational database ค ณล กษณะของข อม ลในคล งข อม ล Non-Volatile Data ข อม ลในคล งข อม ลเป นข อม ลท คงอย ตลอดไปไม ว ำข อม ลจะเก ำเพ ยงใด ข อม ลจะไม ถ กลบออก ท งน เพ อให กำรว เครำะห ข อม ลแบบ Time-Series Data Analysis ให ผลล พธ ท ม ประส ทธ ภำพ อย ำงไรก ตำม แม ข อม ลจะไม ถ กลบจำกคล งข อม ลแต เรำสำมำรถ เปล ยนแปลงร ปแบบกำรจ ดเก บได เพ อให ข อม ลม ขนำดเล กลง เร ยกกระบวนกำร น ว ำ Data Packing 28 14
คล งข อม ล (Data Warehouse Definition) Non-Volatile Data OLTP Database LOADS Data Warehouse Read Add / Change / Delete Read 29 คล งข อม ล (Data Warehouse Definition) Data Warehouse 30 Operational Database ว ตถ ประสงค สน บสน นกำรต ดส นใจ ข นอย ก บล กษณะงำน ล กษณะข อม ล 1. ส วนใหญ เป นข อม ลสร ปหร อ ผลรวมซ งจะเป นต วเลข 2. เป นข อม ลอด ตและป จจ บ น 3. ข อม ลเคล อนไหวเป นระยะๆ (Batch Processing) 1. เป นข อม ลท ลง รำยละเอ ยดม ท งต ว เลขและต วอ กษร 2. เป นข อม ลป จจ บ น 3. ข อม ลเคล อนไหว ตลอดเวลำ (Real Time Transaction) โครงสร ำงข อม ล เปล ยนแปลงตำมควำมต องกำร ไม เปล ยนแปลง ค ณภำพข อม ล เน นควำมสอดคล องของข อม ล เน นควำมถ กต องของข อม ล 15
คล งข อม ล (Data Warehouse Definition) กำรเข ำถ งข อม ล และจำนวนผ ใช กำรเก บรวบรวม ข อม ล Data Warehouse 1. จำนวนข อม ลขนำดใหญ 2. อ ำนได อย ำงเด ยว (read only data) 3. จำนวนผ ใช เป นหล กร อย 1. เก บข อม ลสร ปรวมตำม เวลำหร อตำมหมวดหม 2. เก บข อม ลตำมห วข อ 31 Operational Database 1. จำนวนข อม ลเล กกว ำ DW 2. อ ำนและเข ยนได 3. จำนวนผ ใช เป นหล ก 1000 1. เก บข อม ลรำยละเอ ยด 2. เก บข อม ลตำมล กษณะ งำน กำรประมวลผล OLAP OLTP คล งข อม ล (Data Warehouse) ถ าองค กรม คล งข อม ลหลาย ๆ อ นเพ อใช ในการว เคราะห ต าง ๆ แตกต างก นไป เช นคล งข อม ลด านการเง น และ คล งข อม ลด านทร พยากร มน ษย เราม กเร ยกคล งข อม ลเฉพาะด านเหล าน ว า ตลาดข อม ล (Data Mart) สาเหต ท ต องม การสร าง Data Mart ได แก ม ความเร วใน query ส ง เพราะว าม ข อม ลน อย ม การแย งข อม ลระหว างผ ใช ระบบด วยก นน อย และสามารถปร บปร งข อม ลได อย างรวดเร ว 32 16
คล งข อม ล (Data Warehouse) องค ประกอบหล กๆของคล งข อม ล Data Sources Staging Areas Data Warehouse Database Data Marts Data Usage Data Warehouse 33 คล งข อม ล (Data Warehouse ) องค ประกอบหล กๆของคล งข อม ล Data Sources ได แก Operational database, spreadsheet หร อ text file เป นต น ท งน ย ง รวมถ งข อม ลภำยนอกองค กรท เก ยวข องก บกำรดำเน นธ รก จ Staging Areas เน องจำกข อม ลอำจม ควำมหลำกหลำย ท งในแง ของมำตรฐำน และร ปแบบกำรจ ดเก บ และอำจม ควำมซ ำซ อนก น ด งน นข อม ลจ งจำเป นต องถ ก ปร บให เข ำก บมำตรฐำนของคล งข อม ลก อนท โดยจะม กระบวนกำร ETL (Extract Transform Load) ท ทำหน ำท เป นพ กข อม ล รวมข อม ล ขณะท ถ กปร บ ให เข ำก บมำตรฐำนของคล งข อม ล Data Warehouse Database เป นฐำนข อม ลท ทำหน ำท ในกำรจ ดเก บข อม ล ทำงธ รก จขององค กร Data Warehouse Database จ ดเป นส วนท ม ควำมสำค ญ ท ส ดของคล งข อม ล 34 17
คล งข อม ล (Data Warehouse Definition) องค ประกอบหล กๆของคล งข อม ล Data Mart เป นพ นท สำหร บจ ดเก บข อม ลท ม โครงสร ำงท เหมำะสมต อกำรใช งำนเพ อรองร บ single business process เช น เฉพำะงำนในแผนกใดแผนกหน ง โดยข อม ลใน Data Mart เป นส วนย อยของข อม ลใน DW ทำให ใช เวลำน อยในกำร พ ฒนำ อ กท งกำรประมวลผลท รวดเร วกว ำ 35 มาร ทข อม ล (Data Marts) บทนำ (Introduction) มำร ทข อม ล ค อ คล งข อม ลย อยๆของระด บแผนก ในองค กรอำจจะม คล งข อม ล ขององค กรและในแต ละแผนกอำจจะม มำร ทข อม ลของแผนกน นๆด วย Files Database External Data Data Warehouse Database 36 Data Mart Data Mart Data Mart Data Mart 18
คล งข อม ล (Data Warehouse Definition) Data Warehouse Data Mart ขอบเขต ท งองค กร เฉพำะแผนกหร อส วนงำน ห วข อท สนใจ ม ควำมหลำกหลำยมำกกว ำ ม ควำมหลำกหลำยน อยกว ำ แหล งข อม ล มำจำกหลำยแหล งข อม ลมำกกว ำ แหล งข อม ลน อยกว ำ ระยะเวลำในกำร วำงระบบ ใช เวลำนำนข นก บขนำดของ องค กร ใช เวลำพ ฒนำน อยกว ำเพรำะ สนใจเฉพำะแผนก 37 คล งข อม ล (Data Warehouse Definition) ข อควรระว งระหว าง DW และ Data Mart Data Mart ไม ใช Data Warehouse Data Mart ไม ใช Data Warehouse ขนาดเล ก กล มของ Data Mart ไม ใช Data Warehouse Data Warehouse ไม ใช Decision Support System 38 19
คล งข อม ล (Data Warehouse Definition) กระบวนการคล งข อม ล (Data Warehousing) Data Propagation Data Sources Staging Areas Data Warehouse Database Data Marts Data Usage Metadata 39 คล งข อม ล (Data Warehouse Definition) กระบวนการคล งข อม ล (Data Warehousing) 40 20
ประเภทแบบจำลอง แบบจำลองข อม ลลำด บช น (Hierarchical Data แบบจำลองข อม ลเคร อข ำย (Network Data แบบจ าลองข อม ลเช งส มพ นธ (Relational Data แบบจำลองข อม ลเช งว ตถ (Object-Oriented Data แบบจ าลองข อม ลหลายม ต (Multidimentional Data 41 แบบจำลองข อม ล (Data แบบจ าลองข อม ล (Data ค อส งท ทำให ทรำบว ำข อม ลขององค กรม อะไรบ ำง ม โครงสร ำง อย ำงไร ส มพ นธ ก นอย ำงไร ว ตถ ประสงค (Objectives) เพ อแสดงโครงสร ำงข อม ล ก อนท จะสร ำงโครงสร ำงข อม ลจร งบน Data Warehouse Database เพ อใช เป นเคร องม อในกำรส อสำรทำควำมเข ำใจก บบ คลำกรใน องค กร เพ อใช เป นเคร องม อในกำรส อสำรทำควำมเข ำใจภำยในท มผ พ ฒนำ องค กร เพ อนำไปขยำยผลในกำรสร ำงส วนอ นๆของคล งข อม ลต อไป 42 21
แบบจำลองข อม ล (Data แบบจาลองข อม ลท น ยมใช ส าหร บ Data Warehouse ในป จจ บ นม 2 แบบ 1. Relational Data Model 1) Classification Abstraction 2) Aggregation Abstraction 3) Association Abstraction 4) Generalization Abstraction หร อ Specialization Abstraction 2. Dimensional Data Model 1) Measure Dimension Facts and Fact Table 2) Star Schema 3) Snowflake Schema 4) OLAP and Cubes 43 การออกแบบ Relational Data Model ม จ ดม งหมายเพ อ แสดงความส มพ นธ ของข อม ลต างๆ ท ม อย ในองค กร บางคร ง เน องจากความซ บซ อนของข อม ลม มากด งน นจ งทาให การ ค นหาข อม ลเป นไปได ด วยความยากลาบาก บางกรณ อาจต องเข ยน โปรแกรมท ซ บซ อนเพ อด งข อม ล เพ อความสะดวกจ งม การค ดค น Data Model แบบใหม ท เหมาะส าหร บ แสดงผลล พธ ท เร ยกว า Multidimensional Data 44 22
Primary Key ค อ Attribute ส าหร บระบ ความแตกต างระหว างข อม ลใน Entity เด ยวก น เช น ID Son Son ID Son Name 45 Foreign Key ค อ Attribute ส าหร บอ างอ งความส มพ นธ ระหว าง Entity โดย Foreign Key ท อย ใน Entity ต วหน งจะเป น Primary Key ของ Entity ท ส มพ นธ ก น Mother Mother ID Mother Name Son Son ID Mother ID Son Name 46 23
การออกแบบ Data Model เพ อเอ อต อการเก บ Historical Data เช น รายงานยอดขาย 20/12/2008 ส นค ำอ ปโภค ของเล น ส นค ำฟ มเฟ อย 10,000 บำท 3,000 บำท 1,200 บำท เคร องใช ไฟฟ ำ 4,500 บำท 47 ว นท 30 เร ยกด รายงาน 20/12/2008 ส นค ำอ ปโภค ของเล น ส นค ำฟ มเฟ อย 10,000 บำท 3,000 บำท 1,200 บำท เคร องใช ไฟฟ ำ 3,500 บำท 48 24
Sales Branch ID Sale Date Goods Type Sales Account Sale_History Branch ID Sale Date Goods Type Sales Account Ineffective Date 49 Table Sales Branch_ID Sale_Date Goods_Type Sale_Amount A 20/12/2008 ส นค ำอ ปโภค 10,000 A 20/12/2008 ของเล น 3,000 A 20/12/2008 ส นค ำฟ มเฟ อย 1,200 A 20/12/2008 เคร องใช ไฟฟ ำ 4,500 Table_Sale_History Branch_ID Sale_Date Goods_Type Sale_Amount Ineffective_Date 50 25
Table Sales (30/12/2008) Branch_ID Sale_Date Goods_Type Sale_Amount A 20/12/2008 ส นค ำอ ปโภค 10,000 A 20/12/2008 ของเล น 3,000 A 20/12/2008 ส นค ำฟ มเฟ อย 1,200 A 20/12/2008 เคร องใช ไฟฟ ำ 3,500 Table_Sale_History Branch_ID Sale_Date Goods_Type Sale_Amount Ineffective_Date A 20/12/2008 เคร องใช ไฟฟ ำ 4,500 30/12/2008 51 Table Sales (20/1/2009) Branch_ID Sale_Date Goods_Type Sale_Amount A 20/12/2008 ส นค ำอ ปโภค 10,000 A 20/12/2008 ของเล น 3,000 A 20/12/2008 ส นค ำฟ มเฟ อย 1,200 A 20/12/2008 เคร องใช ไฟฟ ำ 3,500 Table_Sale_History Branch_ID Sale_Date Goods_Type Sale_Amount Ineffective_Date A 20/12/2008 เคร องใช ไฟฟ ำ 4,500 30/12/2008 A 20/12/2008 เคร องใช ไฟฟ ำ 3,500 20/12/2008 52 26
ฐานข อม ลหลายม ต (Multidimensional Database) ช วยให ข อม ลท รวบรวมไว สำมำรถถ กเร ยกใช ได หลำยม มมอง สำมำรถว เครำะห ข อม ลเพ อนำมำใช ในกำรสน บสน นกำรต ดส นใจได รวดเร ว และได ประส ทธ ผลท ด ข น ข อม ลจะถ กเก บเป นร ปแบบของ Array หลำยม ต หร อเร ยกว ำ Data Cube ผ ใช เข ำไปเข ยนข อม ลได เพ ยงท ละคนเท ำน นแต อน ญำตให query ได ท ละ หลำยคน โปรแกรมกำรประมวลผลเพ อกำรว เครำะห แบบออนไลน (OnLine Analytical Processing, OLAP) 53 CUBE Cube ค อโครงสร ำงพ นฐำนของ DW DW สำมำรถม ได มำกกว ำ 1 Cube ผ ใช สำมำรถเข ำถ งข อม ลได หลำกหลำยม มมอง (Dimension) 54 27
55 อย ำงไรก ตำมฐำนข อม ลหลำยม ต ก ย งม ข อจำก ด เช น มำตรฐำนกำร อ นเตอร เฟสเป นแบบเฉพำะต ว (proprietary) อำจทำให ไม เหมำะก บข อม ลท ม ปร มำณมำกๆ และม รำยละเอ ยดมำกๆ เป นต น Measures ต วช ว ดประส ทธ ภำพขององค กร ต วอย ำงประเภทได แก จำนวน ปร มำณ ขนำด ระยะเวลำ เป นต น Measure ต องม ต องม ชน ดของข อม ลเป นต วเลขเสมอ สำมำรถบวกเพ มเพ อหำผลรวมได (Aggregation calculation) ข อม ลเช งต วเลขอำจไม สำมำรถเป น Measure ได เช น... 56 28
Dimension ม ต หร อม มมอง (Dimension) ค อ ส งท ใช ต ควำมหร อระบ ท มำของ measure หร อ ต องกำรด ค ำ measure แบบใด เช น ยอดขำยรำยเด อน ยอดขำยตำมชน ดของส นค ำ เป นต น Dimension Time Dimension Person Dimension Sale Channel Dimension Product Dimension Employee Dimension 57 Dimension Year Semester Quarter Month Day Product Category Product Subcategory - Product Country Region City 58 29
Facts and Fact Table Fact หมำยถ งเหต กำรณ หร อส งท เก ดข นท มำจำกควำมส มพ นธ ระหว ำง measure ก บ dimension ท ทำให เก ดค ำใดค ำหน งท ม ควำมหมำยสำมำรถว ดค ำได และบอกเล ำข อเท จจร งอย ำงใดอย ำง หน ง 1 fact แทนได จำก 1 transaction หร อ 1 event Fact Table ประกอบด วย Fact Identifier Dimension Keys Measures Supportive (Additional) Attributes 59 Measures Dimensions Facts and Fact Table Dimension Measure Fact 1 Fact 2 Fact 3 ว นท ร านค า ประเภทส นค า ยอดขาย (บาท) 12/6/2545 ร ำน ก ของเล น 5000 13/6/2545 ร ำน ก ของเล น 7000 13/6/2545 ร ำน ข ส นค ำบร โภค 5500 60 30
Measures Dimensions Facts and Fact Table ประเภท ช อ ค าท เป นไปได Measure 1 ยอดขำย จำนวนจร ง Measure 2 จำนวนส นค ำท ขำย จำนวนเต ม Dimension 1 ประเภทส นค ำ ส นค ำบร โภค ส นค ำ ควบค ม ฯลฯ Dimension 2 ว นท 5 มกรำคม 2548, เด อนส งหำคม 61 Multidimensinal Data Modeling การสร าง Multidimensional Data Model What is the users want to see? Business Question (Candidate) Measure (Candidate) Dimension (Candidate) Fact Grains of dimensions, and granularities of measures and facts Dimension Hierarchies 62 31
Multidimensinal Data Modeling Example: Users analyzing the performance of the movie theater ticket selling process will basically be interested in the numbers of tickets sold. This leads us to the data item labeled QTY_Tickets_Sold as a candidate measure for the multidimensional data model. What is the users want to see? Quantity of Sales Other performance indicator: revenue, possible discounts being given per sale, tickets being handed out for free, and so forth 63 Business Question Multidimensinal Data Modeling ยอดขำยต วหน งประจำป เป นอย ำงไร ยอดขำยต วหน งแยกเป นไตรมำศเป นอย ำงไร ว นไหนในหน งส ปดำห ท ขำยต วหน งได มำกท ส ดในสำมเด อนแรก ว นไหนในหน งส ปดำห ท ขำยต วหน งได ต ำท ส ด ในสำมเด อนแรก สำขำไหนท ขำยต วหน งได มำกท ส ดในคร งป น สำขำไหนท ขำยต วหน งได มำกท ส ดในคร งป น ยอดขำยต วหน งแยกประเภทกำรขำยเป นอย ำงไร อ นๆ 64 32
Multidimensinal Data Modeling Measure 65 Multidimensinal Data Modeling Dimensions 66 33
Multidimensinal Data Modeling Dimensions 67 Facts and Fact Table Multidimensinal Data Modeling 68 34
Multidimensinal Data Modeling Facts and Fact Table Fact ID : MOVIE SALES KEY Dimension Keys: MOVIE KEY, DAY KEY and THEATER ID Measures: SALES UNITS Supportive Attributes: SALES USD, SALE EUR 69 Multidimensinal Data Modeling Grains of dimensions, and granularities of measures and facts Grain ใน Dimension ค อ ระด บท ต ำท ส ดของ Dimension Granularity ใน Measure ค อ ระด บท ต ำท ส ดในกำรบ นท ก รำยละเอ ยดท ได จำกค ำท ระบ จำกท กๆGrain เพ อนำมำว เครำะห Measure The finer the granularity, the more detailed the information analysis can be performed The finer the granularity, the more the volume of the data will be recorded 70 35
Multidimensinal Data Modeling Granularities of measures and facts The size of DW or Data Mart The performance and resource consumption of the user analysis Dimension Hierarchies Dimension : one or more dimension hierarchies Each dimension hierarchy can include several aggregation levels 71 Multidimensional Data Modeling 72 36
Another Example An automobile manufacturer wants to increase sale volumes by examining sales data collected throughout the organization. The evaluation would require viewing historical sales volume figures from multiple dimensions such as - Sales volume by model - Sales volume by color - Sales volume by dealer - Sales volume over time 73 Relational Structure 74 37
Multidimensional Structure 75 Schemas for Dimensional Data Model or Dimension Model Star Schema Snowflake Schema 76 38
Star Schema 77 Star Schema 78 39
Star Schema 79 Star Schema 80 40
Star Schema Date Id Date Dd/mm/yyyy Shop Shop Id Shop Name Sales Shop Id Product Id Date Id Sales Amount Product Product Id Product Name 81 Shop Id แสดงโครงสร าง Shop Name Product Id Product Name 001 aaa 112 Potato 002 bbb 113 Cake 003 ccc 114 Biscuit Shop Id Product Id Date Id Sales Amount 001 112 2130 800 001 113 2156 900 002 113 2156 700 003 114 2156 600 Date Id DD/MM/YYYY 2130 13/01/2008 2165 14/01/2008 2174 15/01/2008 82 41
Star Schema 83 Star Schema 84 42
Snowflake Schema 85 Snowflake Schema 86 43
Snowflake Schema Region Region Id Region Name Date Id Date Dd/mm/yyyy Product Type Product Type Id Product Type Name Shop Region Id Shop Id Shop Name Sales Region Id Shop Id Product Type Id Product Id Date Id Sales Amount Product Product Type Id Product Id Product Name 87 Snowflake Schema 88 44
Snowflake Schema 89 Star Schema Denormalized Model Easy for user to understand Fast response to queries Simple metadata Suitable for multidimensional data model Does not support to history 90 Snowflake Schema Normalized Model Quite complex for user to understand More flexible to requirements More complex metadata Not suitable for multidimensional data model support to history 45
constellation schema 91 Online-Analytic Processing OLAP and Cubes OLTP & OLAP 92 46
Online-Analytic Processing OLAP and Cubes กำรเข ำถ งข อม ล และจำนวนผ ใช กำรเก บรวบรวม ข อม ล Data Warehouse 1. จำนวนข อม ลขนำดใหญ 2. อ ำนได อย ำงเด ยว (read only data) 3. จำนวนผ ใช เป นหล กร อย 1. เก บข อม ลสร ปรวมตำม เวลำหร อตำมหมวดหม 2. เก บข อม ลตำมห วข อ 93 Operational Database 1. จำนวนข อม ลเล กกว ำ DW 2. อ ำนและเข ยนได 3. จำนวนผ ใช เป นหล ก 1000 1. เก บข อม ลรำยละเอ ยด 2. เก บข อม ลตำมล กษณะ งำน กำรประมวลผล OLAP OLTP Online-Analytic Processing OLAP and Cubes การประมวลผลธ รกรรมออนไลน (Online Transactional Processing, OLTP) และ การประมวลผลเช งว เคราะห ออนไลน (Online Analytical Processing, OLAP) - OLTP เป นกำรประมวลผลท จ ดกำรก บข อม ลป จจ บ นเป นหล กซ ง แตกต ำงจำก OLAP ท จ ดกำรก บข อม ลท เก บในคล งข อม ล 94 47
ระบบการประมวลผลธ รกรรมออนไลน (Online Transactional Processing, OLTP) ระบบฐานข อม ลม กถ กสร างข นเพ อใช งานในระบบ OLTP ซ ง เป นการจ ดการก บข อม ลป จจ บ น รายงานท สร างจากระบบ OLTP จะม การอ พเดทข อม ลให ท นสม ย อย เสมอ แนวค ดการออกแบบระบบ OLTP ม งเน นให ระบบทางานได อย าง รวดเร วและถ กต องพร อมท งรองร บการเข าถ งจากผ ใช หลายๆคน พร อมก นเร ยกว า ระบบม ลท ย สเซอร 95 ระบบการประมวลผลเช งว เคราะห ออนไลน (Online Analytical Processing, OLAP) ระบบ OLAP ม งเน นข อม ลประว ต ของทรานแซ กช น ในช วง ระยะเวลาหน งแตกต างจากระบบ OLTP ท ต องม การอ พเด ทข อม ล อย เสมอเพ อเร ยกด ข อม ลในขณะน น ผ ใช ระบบ OLAP ส วนใหญ จะเป นผ บร หารหร อผ ใช อ นๆท ต องการข อม ลเช งว เคราะห ในการเร ยกด ข อม ลในระบบ OLAP ต องม ความรวดเร วเน องจาก ต องจ ดการก บข อม ลท ม ความจ ขนาดใหญ ด งน นจ งอาจน า เทคโนโลย การประมวลผลแบบขนานมาใช งานเพ อการประมวลผล ม ความรวดเร ว 96 48
เปร ยบเท ยบการทางานระหว าง OLTP ก บ OLAP OLTP จ ดเก บข อม ลป จจ บ น OLAP จ ดเก บข อม ลย อนหล ง ข อม ลท จ ดเก บเป นข อม ลรายละเอ ยด ข อม ลท จ ดเก บเป นข อม ลรายละเอ ยด ข อม ลสร ป อย างง าย และข อม ลสร ปข นส ง ข อม ลม ความเคล อนไหวอย เสมอ ข อม ลคงท เป นการประมวลผลซ าๆท ม โครงสร างช ดเจน เป นการประมวลผลแบบ Ad-Hoc แบบ ไม ม โครงสร างช ดเจน ใช ข อม ลทรานแซกช นเป นต วข บเคล อน ใช การว เคราห เป นต วข บเคล อน สน บสน นการทางานในล กษณะว นต อว น สน บสน นการต ดส นใจเช งกลย ทธ ให บร การผ ใช เพ อปฏ บ ต งานพร อมก นจ านวน มาก 97 ให บร การผ ใช งานในระด บผ บร หาร ซ งม จานวน น อย Online-Analytic Processing OLAP and Cubes Online-Analytic Processing (OLAP) and Cubes ค อ ว ธ กำรท ใช ในกำรว เครำะห ข อม ลด วย Dimension และ Fact Table โดย Fact Table และ Dimension Table จะถ กประมวลผลสำหร บกำร นำไปใช งำนโดยภำพท ผ ใช เพ อมองผลท ได จำกกำรประมวลผล จะอย ใน ร ปล กบำศก หลำยม ต (Multidimension) เร ยกว ำ Cube โดยจะม จำนวนม ต เท ำก บจำนวน Dimension OLAP is a software technology that enables analysts, managers, and executives (sometimes called knowledge workers) to access data using an easy and efficient query analysis tools 98 49
2 st Dimension 2 st Dimension 1/17/2014 Online-Analytic Processing OLAP and Cubes Online-Analytic Processing (OLAP) and Cubes OLAP transforms raw data so that it reflects the real dimensionality of the enterprise as understood by user OLAP is a decision support tool which enable sophisticated analysis of an organization s performance by providing access to views which characterize the multidimensional nature of the enterprise [Codd et at 1993] 99 Online-Analytic Processing OLAP and Cubes Online-Analytic Processing (OLAP) and Cubes 1 st Dimension 4 th Dimension 1 st Dimension 100 50
Online-Analytic Processing OLAP and Cubes Online-Analytic Processing (OLAP) and Cubes Product ID 657 125 500 897 Date ID 124 200 750 1567 Shop ID 123 350 001 004 003 101 1567 Relational Structure 102 51
Multidimensional Structure 103 Viewing Data - An Example Sales Volumes M O D E L COLOR DEALERSHIP Assume that each dimension has 10 positions, as shown in the cube above 52
Multidimensional Structure 105 Online-Analytic Processing OLAP and Cubes Online-Analytic Processing (OLAP) and Cubes 106 53
Online-Analytic Processing OLAP and Cubes Online-Analytic Processing (OLAP) and Cubes 107 Online-Analytic Processing OLAP and Cubes Type of OLAP Server Multidimensional OLAP (MOLAP) Relational OLAP (ROLAP) Hybrid OLAP (HOLAP) Desktop OLAP(DOLAP) 108 54
Online-Analytic Processing OLAP and Cubes Multidimensional OLAP (MOLAP) ใน MOLAP จะทำกำรข อม ลจำก Data Warehouse Database ท จะต องสอดคล อง ก บ Data Cube ท เรำสร ำงข น โดยข อม ลใน Data Warehouse Database จะถ ก โหลดเข ำมำเก บไว ใน Data Cube ผ ใช สำมำรถว เครำะห ข อม ลได โดยตรง ผ ำน MOLAP ได โดยตรง และหำกต องกำรว เครำะห ข อม ลช ดใหม จะต องทำกำรโหลด ข อม ลลง Data Cube จ งประมวลผลต อไป ข อด กำรด งข อม ลจำก MOLAP จะเร วมำกเพรำะไม ต องคำนวณค ำใดๆอ ก MOLAP เหมำะก บงำนท ถ กเร ยกใช บ อย และไม จำเป นต องต ดตำมกำร เปล ยนแปลงข อม ลอย ำงใกล ช ด ข อด อย 109 Online-Analytic Processing OLAP and Cubes Multidimensional OLAP (MOLAP) ข อด อย ข อจำก ดในกำรโหลดข อม ลเพรำะต องข นก บขนำดของ Data Cube ท เรำ สร ำงข นด วย ด งน นจ งเหมำะก บฐำนข อม ลขนำดเล ก อำจต องลงท นเพ มเก ยวก บ Cube Technology 110 55
Online-Analytic Processing OLAP and Cubes Multidimensional OLAP (MOLAP) 111 Online-Analytic Processing OLAP and Cubes Relational OLAP (ROLAP) ค อ OLAP หร อ Cube ท ไม ต องม กำรประมวลผล OLAP แต ประย กต ใช ฐำนข อม ลเช งส มพ นธ Relational Database ROLAP เป นซอฟแวร ในกำรด งข อม ลจำก Relational Database กำรเร ยกใช ข อม ลระบบสร ำง Query ด งข อม ลจำก Fact Table ข อด รองร บข อม ลปร มำณมำกๆได กล ำวค อสำมำรถรองร บได เท ำก บ ขนำดของ Relational Database ท ม อย ข อม ลท ได จะม ควำมท นสม ยอย เสมอ 112 56
Online-Analytic Processing OLAP and Cubes Relational OLAP (ROLAP) ข อด อย เม อม กำรเร ยกใช ข อม ลระบบจะสร ำง Query เพ อด งข อม ลมำจำก Fact Table ซ งว ธ กำรน จะช ำกว ำกำรเร ยกใช ข อม ลจำก MOLAP ROLAP ไม เหมำะก บงำนท ใช งำนบ อย แต เหมำะก บระบบท ต องต ดตำม ควำมเป นไปของข อม ลอย ำงใกล ช ด Software: Microsoft Analysis Service, SAP Business Objects, Oracle Business Intelligence Suite Enterprise Edition 113 Online-Analytic Processing OLAP and Cubes Hybrid OLAP (HOLAP) ค อ OLAP หร อ Cube ท ม กำรแบ งพ นท ออกเป นส วนโดยแต ละส วนอำจใช ว ธ กำรจ ดเก บข อม ลแบบ MOLAP และบำงส วน เก บข อม ลแบบ ROLAP กำรใช HOLAP ช วยให กำรเข ำถ งข อม ลแบบ Drill Down เป นไปได อย ำงม ประส ทธ ภำพมำกข น โดย HOLAP จะใช MOLAP เพ อจ ดเก บข อม ลท เป นข อม ลสร ป และใช ROLAP เพ อจ ดเก บข อม ลท เป นรำยละเอ ยด เช น ใช MOLAP เก บข อม ล กำรขำยรำยภำคและรำยจ งหว ด แต ROLAP เก บข อม ลกำรขำย รำยอำเภอและข อม ลรำยรำยกำร 114 57
Online-Analytic Processing OLAP and Cubes Desktop OLAP (DOLAP) เป นกำรด ง Cube จำก Server มำเก บไว ท Client เลย จำกน นก ว เครำะห ด วย desktop เอง ทำให ไม ต องด งข อม ลส งไปมำทำให ด เหม อนว ำน ำจะ ทำงำนได เร ว แต ถ ำข อม ลขนำดใหญ ก ย งคงช ำ เพรำะว ำ desktop ไม ม ทร พยำกรท เพ ยงพอในกำรจ ดกำรก บข อม ลขนำดใหญ 115 OLAP Operations in the Multidimensional Data Model OLAP Operations Roll Up และ Drill Down Slice และ Dice 116 58
Online-Analytic Processing OLAP and Cubes Roll Up และ Drill Down ค อกำรเปล ยนระด บควำมละเอ ยดในกำรพ จำรณำข อม ล ซ ง ว ธ กำรน จะใช ก บ Snowflakes Dimensional Data Model Drill Down ค อกำรเพ มควำมละเอ ยดในกำรพ จำรณำข อม ลจำด ระด บท หยำบไปหำระด บท ละเอ ยดมำกข น Roll Up ค อกำรพ จำรณำข อม ล จำกระด บท ละเอ ยดข นมำระด บ ท หยำบมำกข น 117 Fact Table รำยกำรขำยส นค ำ Online-Analytic Processing OLAP and Cubes Region Shop Date Product Type Product Amount ภำคเหน อ A 12/12/2003 เคร องเข ยน สม ด 5000 ภำคเหน อ B 13/12/2003 ส นค ำบร โภค ข ำวสำร 1000 ภำคเหน อ A 13/12/2003 เคร องเข ยน ปำกกำ 10000 ภำคเหน อ B 12/12/2003 ส นค ำบร โภค น ำด ม 7000 ภำคใต C 13/12/2003 เคร องเข ยน ปำกกำ 6000 ภำคใต C 12/12/2003 เคร องเข ยน สม ด 4000 ภำคใต C 13/12/2003 เคร องเข ยน ยำงลบ 2000 ภำคใต C 13/12/2003 ส นค ำบร โภค ข ำวสำร 2000 118 59
Online-Analytic Processing OLAP and Cubes Cube ท ได จำก Fact Table Region Product Type ส นค าอ ปโภค เคร องเข ยน Product ข ำวสำร น ำด ม สม ด ปำกกำ ยำงลบ Shop ภำคเหน อ A 5000 10000 ภำคเหน อ B 1000 7000 6000 2000 ภำคใต C 2000 4000 119 Online-Analytic Processing OLAP and Cubes Roll Up Region Sum ภำคเหน อ 31,000 ภำคใต 6,000 Product Type เคร องเข ยน ส นค าอ ปโภค Region ภำคเหน อ 23,000 8000 ภำคใต 4,000 2000 Drill Down Roll Up Region Product Type ส นค าอ ปโภค เคร องเข ยน Product ข ำวสำร น ำด ม สม ด ปำกกำ ยำงลบ Shop ภำคเหน อ A 5000 10000 ภำคเหน อ B 1000 7000 6000 2000 ภำคใต C 2000 4000 120 Drill Down 60
Online-Analytic Processing OLAP and Cubes Roll up and drill down 121 Online-Analytic Processing OLAP and Cubes Drill Down 122 61
Online-Analytic Processing OLAP and Cubes Slice และ Dice Slice ค อ กำรเล อกพ จำรณำผลล พธ บำงส วนท เรำสนใจ โดยเล อก ค ำของบำง Dimension เช น กำรด รำยกำรส นค ำจำกม มมองของ ประเภทส นค ำ เป นต น Slice ต ำงจำก Drill Down and Roll Up ตรงท กำร Slice สำมำรถทำ ได ท ง Star Schema และ Snowflake Schema Dice ค อ กระบวนกำรด ข อม ลด วยกำรเปล ยนม มมอง ให ตรงก บ ควำมต องกำรของผ บร โภคเช น กำรด ค ำระหว ำง Shop Product Type หร อ Shop Product เป นต น 123 Fact Table รำยกำรขำยส นค ำ Online-Analytic Processing OLAP and Cubes Region Shop Date Product Type Product Amount ภำคเหน อ A 12/12/2003 เคร องเข ยน สม ด 5000 ภำคเหน อ B 13/12/2003 ส นค ำบร โภค ข ำวสำร 1000 ภำคเหน อ A 13/12/2003 เคร องเข ยน ปำกกำ 10000 ภำคเหน อ B 12/12/2003 ส นค ำบร โภค น ำด ม 7000 ภำคใต C 13/12/2003 เคร องเข ยน ปำกกำ 6000 ภำคใต C 12/12/2003 เคร องเข ยน สม ด 4000 ภำคใต C 13/12/2003 เคร องเข ยน ยำงลบ 2000 ภำคใต C 13/12/2003 ส นค ำบร โภค ข ำวสำร 2000 124 62
Online-Analytic Processing OLAP and Cubes Cube ท ได จำก Fact Table Region Product Type ส นค าบร โภค เคร องเข ยน Product ข ำวสำร น ำด ม สม ด ปำกกำ ยำงลบ Shop ภำคเหน อ A 5000 10000 ภำคเหน อ B 1000 7000 6000 2000 ภำคใต C 2000 4000 125 Online-Analytic Processing OLAP and Cubes Slice (เล อก เคร องเข ยน) Region Product Type เคร องเข ยน Product สม ด ปำกกำ ยำงลบ Shop ภำคเหน อ A 5000 10000 ภำคเหน อ B 6000 2000 ภำคใต C 4000 126 63
Online-Analytic Processing OLAP and Cubes Slice (เล อก ภาคเหน อ) Region Product Type ส นค าอ ปโภค เคร องเข ยน Product ข ำวสำร น ำด ม สม ด ปำกกำ ยำงลบ Shop ภำคเหน อ A 5000 10000 ภำคเหน อ B 1000 7000 6000 2000 127 Online-Analytic Processing OLAP and Cubes Fact Table รำยกำรขำยส นค ำ Region Shop Date Product Type Product Amount ภำคเหน อ A 12/12/2003 เคร องเข ยน สม ด 5000 ภำคเหน อ B 13/12/2003 ส นค ำบร โภค ข ำวสำร 1000 ภำคเหน อ A 13/12/2003 เคร องเข ยน ปำกกำ 10000 ภำคเหน อ B 12/12/2003 ส นค ำบร โภค น ำด ม 7000 ภำคใต C 13/12/2003 เคร องเข ยน ปำกกำ 6000 ภำคใต C 12/12/2003 เคร องเข ยน สม ด 4000 ภำคใต C 13/12/2003 เคร องเข ยน ยำงลบ 2000 ภำคใต C 13/12/2003 ส นค ำบร โภค ข ำวสำร 2000 128 64
Online-Analytic Processing OLAP and Cubes Fact Table รำยกำรขำยส นค ำ Region Shop Date Product Type Product Amount ภำคเหน อ A 12/12/2003 เคร องเข ยน สม ด 5000 ภำคเหน อ B 13/12/2003 ส นค ำบร โภค ข ำวสำร 1000 ภำคเหน อ A 13/12/2003 เคร องเข ยน ปำกกำ 10000 ภำคเหน อ B 12/12/2003 ส นค ำบร โภค น ำด ม 7000 ภำคใต C 13/12/2003 เคร องเข ยน ปำกกำ 6000 ภำคใต C 12/12/2003 เคร องเข ยน สม ด 4000 ภำคใต C 13/12/2003 เคร องเข ยน ยำงลบ 2000 ภำคใต C 13/12/2003 ส นค ำบร โภค ข ำวสำร 2000 129 Online-Analytic Processing OLAP and Cubes Dice (Shop vs Product Type) Product Type ส นค าบร โภค เคร องเข ยน Shop A 0 6,000 B 8,000 8,000 C 2,000 4,000 130 65
Company LOGO 131 66